# HTML转文本

[html2text](https://github.com/Alir3z4/html2text/) 是一个将`HTML`页面转换为清晰易读的纯`ASCII文本`的Python软件包。

这个ASCII文本也恰好是有效的`Markdown`（一种文本到HTML的格式）。

## 安装和设置

```bash
pip install html2text
```

## 文档转换器

查看一个[使用示例](/docs/integrations/document_transformers/html2text)。

```python
from langchain_community.document_loaders import Html2TextTransformer
```